牛顿法(英语:Newton’s method)又称为牛顿-拉弗森方法(英语:Newton-Raphson method),它是一种在实数域和复数域上近似求解方程的方法。方法使用函数$\displaystyle f(x)$的泰勒级数的前面几项来寻找方程$\displaystyle f(y)=0$的根。
——维基百科
牛顿法可以通过迭代逼近的方法,求得函数$f(x)=0$的解。
- 先初始化某个点$x_0$,对该点求导数$f’(x_0)$,可以得到一条切线;
- 切线会和横轴再有一个交点$x_1$,然后再重复第一步;
- 直到$f(x_n)=0$
通过一系列推导,我们可以得知:
于是,我们可以将牛顿法用于极大似然估计,也就是求$l(\theta)$的最大值,可以看做是求$l’(\theta)=0$的解。
那么,每次迭代就可以写成:
更一般地,可以写成:
其中,$H$是$l(\theta)$的 Hessian 矩阵:
但这个方法有个缺点,每次迭代的时候,都需要重新计算$H^{-1}$,虽然牛顿法对函数$f$有很多要求和限制,但对于 logistic 函数而言,足够有效。